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关联 开放 数据 在 图 书展 报 服务 的 应 用 光 辑 
分 析 


顾 立 平 
(中 国 科学 院 国家 科学 图 书馆 北京 100190 ) 


【摘要 】 开 放 关 联 数据 是 开放 科学 中 的 开放 数据 集成 应 用 的 一 项 重要 部 分 ,简介 关联 开放 数据 的 应 用 需求 与 范 
畴 ;聚焦 图 书馆 应 用 开放 关联 数据 的 实施 方案 ,包括 如 何 转化 书目 数据 与 使 用 数据 为 开放 数据 ,以 及 如 何 应 用 社 
会 网 络 和 社会 标签 这 类 开放 数据 ;系统 性 分 析 书 目 品质 提升 .电子 资源 管理 信息 计量 分 析 专利 竞争 情报 数字 
典藏 .向 入 式 学 科 咨 询 等 的 关联 开放 数据 的 技术 路 线 。 

Xs] 开放 科学 ”开放 数据 ”关联 数据 ”语义 网 本 体 ”社会 网 络 社会 标签 ”社会 媒体 ” 社 群 空间 
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[Abstract] The Linked Open Data ( LOD) is one important part of the open data application and integration under the 
open science. This article introduces briefly the application need and field of the LOD, focuses on the implementation of 
the library using LOD include how to transfer the bibliography and the usage data into open data and how to use the open 
data as like social network and social tagging. The author also systemically analyses the technology roadmap of the 
Cimprovement by using LOD on bibliographic quality, electronic resource management, informatics application, patent 
competitive intelligence and digital archives. 
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1 图 书馆 在 开放 科学 时 代 中 处 理 开放 数据 的 抉择 


重复 使 用 刊载 在 科学 出 版 物 上 的 知识 以 及 公开 批判 ,是 科学 的 两 大 基础 ;开放 科学 数据 是 促使 科研 工作 有 效 
运作 以 及 社会 充分 从 科学 劳动 中 获 益 的 关键 ,其 基础 是 有 效 地 传播 具有 开放 性 ( Openness) 的 科研 数据 。 在 网 
络 时 代 , 能 够 支持 开放 知识 .开放 内 容 与 开放 服务 的 开放 性 具有 11 项 特征 : 近 用 /获取 (Access) EA i E 
复 使 用 无 技术 限制 署名、 完整 .平等 对 竺 用 户 .平等 看 待 领 域 . 授 权 散 布 .授权 条 款 不 得 专属 于 特定 产品 .授权 条 
款 不 得 限制 散布 其 他 作品 等 。 因 此, 并非 所 有 网 络 信息 都 具备 开放 性 的 特征 , 正 因 如 此 ,充分 推展 以 及 利用 现 有 
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的 开放 数据 ,成 为 当代 科学 发 展 的 关键 问题 。 

男 一 方面 ,网 络 信息 资源 具有 异类 (不 同 内 容 类 型 
和 体裁 ) . 异 构 ( 不 同 的 数据 格式 及 相应 的 语义 规则 ) 
和 分 布 式 的 特点 ,不 利于 将 信息 资源 集中 一 处 (如 图 书 
馆 ) 的 传统 处 理 方式 ; 作为 一 种 新 兴 的 知识 组 织 和 知 
识 发 现 方式 ,关联 数据 (Linked Data) 提 供 了 一 套 低 成 
本 的 标准 化 数据 访问 机 制 ,并 且 可 以 有 效 地 规避 一 些 
复杂 的 数据 权益 纷争 问题 ;然而 ,在 发 布 现 有 资源 的 
Linked Data 过 程 中 ,存在 因为 不 同 服务 方式 ,不同 分 类 
体系 不 同 数据 内 容 , 以 及 不 同 领域 中 采用 不 同 的 本 体 
及 词 表 所 带 来 的 复杂 性 ”。 这 项 复杂 性 又 带 来 交互 界 


Tf 面 .关系 有 效 性 .数据 融合 映射 数据 许可 权 等 问题 ” 。 


了: 为 语义 网 发 展 的 重要 推力 之 一 ,关联 数据 通过 网 络 
CE 外 以 前 没有 关联 的 相关 数据 连接 起 来 ,其 关键 是 “ 采 
C 作 数据 .公布 关联 数据 .规范 化 链接 中 的 “连接 点 ” .从 
CGC 全 别 数据 集 获得 数据 以 及 客户 端 应 用 程序 数据 等 。 处 


(再 程序 和 规则 的 关联 开放 数据 ( Linked Open Data, 


CDoD) 包括 (9 :标准 (Standards) .获取 ( Access) .许可 
: License) 、 识 别 符 Identifiers ( URIs ) .数据 模型 Data 


CModel 如 资源 描述 框架 RDF) ,本 体 (RDFS，OWL) 查 
ELE SPARQL) 等 6 个 核心 要 素 。 


在 网 络 化 数字化、 开放 化 的 科研 时 代 中 ,图 书 情 


> 彼 事 业 必须 正视 开放 数据 及 其 开放 科学 的 新 兴 需 求 ， 


cili LOD 正当 其 时 。 


了 呈 。 关 联 开放 数据 的 形式 远 辑 


传统 上 ,图 书馆 处 理 数 据 的 方式 分 为 数据 和 元 数 
据 ,数据 被 采集 和 保存 ,狭义 可 指 计算 机 中 的 一 组 位 
元 ,广义 可 指 图 书 期刊. 报章 . 单 件 电子 档案 等 内 容 载 
体 ,而 元 数据 则 是 用 以 描述 广义 数据 下 的 数据 ,如 书 
日 、 索 摘 、 分 类 目录 等 。 在 此 基础 之 上 ,专家 可 以 进行 
获取 ,分 析 、 呈 现 等 情报 工作 。 

理论 上 ,快速 发 展 的 网 络 环境 以 及 运算 技术 使 数 
据 可 以 自由 流通 、 元 数据 可 以 自由 创建 ,并 且 可 以 凭借 
数据 集 的 重新 组 合 、 添 加 、 删 减 等 动作 创建 新 的 数据 
集 ; 可 以 建立 元 数据 进行 元 数据 与 元 数据 之 间 的 关系 ， 
从 这 些 关系 中 找到 原先 不 被 找到 的 数据 。 者 以 函数 表 
示 , 如 下 : 

(1) 数 据 集 Didl,d2,…,dn| ;描述 DD 的 元 数据 M 
{mldl ,m2d2 ,… ,mndn| 。 


14 现代 图 书 情报 技术 


(2) 数 据 集 D |d' 1,d'2,---,d'n] ;描述 D 的 元 
数据 Mimld’1,m2d’2,:…,mnd’n|。 

(3) 数 据 集 D”|d”1,d”2,…,d”n| ;描述 D 的 元 
数据 M’ [m 1d”1,m’2d”2,.…,m’nd”n|。 

根据 传统 方式 : 

(4) 从 M 中 提取 ml 和 m3 可 得 D1dl1,d3} 以 及 
D'id'1,4'3], 

ZAT , WREX M =M’ W: 

(5) Jk M 中 提取 ml 和 m3 可 得 D|dl,d3| 以 及 
D'id'1,4'3] UK D'1d"1,4"73] , 

如 果 定 义 M~M’ 其 中 ml =m1 H m3zm'3 则 : 

(6) J M 中 提取 ml 和 m3 可 得 Didl,d3| 以 及 
D ”1d”1,d”3| 以 及 D”|d”1}。 

综 上 ,比较 (4)、(5)、(6) 后 ,可 见 此 策略 具有 两 个 
作用 : 

GD 从 被 定义 的 新 关系 中 找到 原先 不 会 被 找到 的 数据 ; 

@@ 调 整定 义 可 以 遮蔽 部 分 数据 。 如 此 ,一 开 一 关 , 形 成 
B] 4& 

7K E. , 若 以 函数 工 表 示 各 个 D 的 访问 许可 , 则 从 M 
到 DD 的 提取 过 程 必需 增加 工 函数 ,现实 中 的 许可 证 的 
形式 有 许多 种 ,如 开放 性 的 11 种 特征 等 ,为 求 理解 而 
简化 许可 证 工 仅 有 两 种 形式 : 

L =0 // 不 允许 访问 
L=1 // 允 许 访问 

由 此 考虑 到 :如 果 数 据 不 开放 ,如 何 进行 关联 ? 
3 ”关联 开放 数据 的 三 种 效果 

将 以 上 疑问 重 设 为 可 观察 的 研究 问题 , 则 是 :在 何 
种 程度 的 开放 性 下 能 够 利用 关联 阀 值 产生 何 种 效果 ? 
如 果 LOD 能 够 最 大 化 数据 的 开放 性 , 则 有 三 个 显著 
效果 : 


(1) 对 网 络 上 非 结 构 化 文本 进行 结构 化 

虽然 结构 化 数据 量 不 断 在 网 络 上 增加 (特别 是 为 
了 促进 联系 的 主动 公开 数据 ) ,网 络 上 还 包括 (而 且 主 
要 是 ) 非 结构 化 数据 ,特别 是 文本 内 容 。 因 此 ,一 个 重 
要 的 问题 是 :如 何 使 人 们 在 网 络 上 能 够 有 效 地 访问 大 
量 的 非 结构 化 信息 ? 

设 文本 信息 TID1，D2,…,Dnl ; 若 要 D 满足 LOD 
形式 逻辑 ,有 两 种 方式 : 

DAHEIM Z) (Data - driven) :根据 D1 | d, d2,, +, dn] 和 
D2|d1,d2,---,dn| 中 的 相同 数据 d 形成 新 的 文本 数据 集 TD 


|d1,02,--.,dn|, 
@) 情 景 感知 (Inductive ) :根据 已 知 数据 集 D' | dl ,d2， 
dn] 匹配 文本 信息 T|D1, D2,…,Dn| 中 的 相似 数据 集 D。 
将 两 种 方式 结合 :本 体 、 机 械 学 习 , 信 息 检索 、 信 息 
提取 和 文本 挖掘 的 整合 "是 信息 检索 的 热点 问题 。 
(2) 在 信息 结构 化 的 基础 上 强化 信息 检索 准确 化 
通过 LOD 增强 基于 关键 字 的 搜索 是 强化 网 络 导 
航 系统 的 一 项 新 作法 "1 。 根据 LOD 的 形式 逻辑 ,交替 
利用 各 种 M= M' 和 M ~M 逻辑 ,能 够 形成 一 个 信息 
伶 索 核 心 索引 的 分 类 机 制 ,避免 数据 集 D.D”、D” 原 
先 面临 的 第 (4) 项 情况 。 然 而 ,存在 不 同 的 URL 在 不 
了 同 数据 集中 的 相同 对 象 等 数据 异 质 性 难题 " ,解决 办 
重 是 根据 语义 相似 性 度量 ,配合 相关 算法 ,使 用 本 体 和 
CC 请 息 架构 ,提高 针对 同一 对 象 的 识别 程度 !” 。 
LOD 提供 实体 类 型 的 信息 ,可 视 为 命名 实体 分 类 
C 时 的 先 验 知识 ,用 LOD 的 方法 提取 信息 (命名 实体 的 
(全 符 申 类型) 来 建立 一 个 新 的 类 型 的 知识 基础 ,加 入 
CI 现 有 的 分 类 体系 后 ,能 够 提高 应 用 程序 的 性 能 。 
C4 (3 ) 在 信息 检索 准确 化 的 基础 上 扩大 信息 范围 
Co 关联 数据 不 但 预先 建立 了 数据 对 象 之 间 的 可 靠 关 
CR ,而且 迅速 发 展 的 关联 数据 空间 为 构建 高 效 的 关联 
小 考 服务 提供 了 强大 的 资源 支持 。 传 统 意义 上 的 
> 很 索 是 基于 关键 词汇 的 文件 导向 查询 ,而 LOD 则 跨越 
Cfr tpe ein RDF 格式 和 SPARQL 查询 语言 
和 准 的 基础 上 ,以 机 器 可 读 的 (Machine - readable ) 方 
(或 与 类 型 相关 的 实体 之 间 进 行 网 络 数 据 链接 , 它 更 类 
似 于 分 布 式 或 者 联合 数据 库 , 但 与 之 合作 的 数据 源 则 
是 独立 维护 和 更 新 他 们 各 自 的 数据 ” 。 例 如 ,基于 实 
例 的 myCBR 2& £t 5! ,经 过 模型 生成 ,数据 导入 、 相 似 
模型 .解释 ,以 及 可 视 化 用 户 界面 ,利用 Symbolic 从 不 
同 实体 的 文本 中 提取 信息 ,进行 数据 关联 和 信息 推荐 。 
4 图 书馆 的 LOD 具体 操作 方案 
图 书馆 使 用 关联 数据 技术 能 够 将 资源 发 布 为 关联 
数据 改善 检索 服务 系统 的 效果 .增强 资源 发 现 服务 、 
实现 数据 融合 与 语义 检索 服务 . 跨 机 构 数据 存 取 和 重 
用 、 促 进 学 术 研 究 和 学 术 交 流 ,实现 图 书馆 与 教学 系统 
之 间 的 集成 等 。 事 实 上 ,中 国 科学 院 国家 科学 图 
书馆 已 经 将 机 构 知 识 库 (IR) 中 的 实体 关系 发 布 为 能 
够 进行 语义 揭示 的 关联 数据 格式 并 且 将 IR 中 的 实体 
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数据 进行 语义 标注 S 
不 过 ,满足 开放 科学 所 需 的 开放 数据 ,不 仅 只 有 上 
述 关 联 数据 技术 的 应 用 ,以 下 所 述 是 如 何 导 出 图 书馆 
的 书目 数据 和 使 用 数据 ,以 及 如 何 导入 社会 网 络 和 社 
会 标签 的 LOD 具体 方案 。 
4.1 将 封闭 数据 ( 馆 内 ) 转 换 为 开放 数据 ( 馆 外 ) 
(1) LOD 包括 开放 (标准 、 获 取 、 许 可 ) 和 关联 ( 识 
别 符 数据 模型 本体、 查询 语言 ) 两 个 部 分 ”。 因 此 ， 
考虑 共同 协议 能 够 让 图 书馆 从 关联 数据 拓展 到 开放 关 


联 数据 。 
(2) 输 出 数据 有 多 种 方式 ,如 使 用 一 个 系统 模 组 、 
加 配 一 套 转 档 系统 ,或 者 进入 文件 系统 内 直接 复制 转 


出 部 分 . dat 和 . ini 文档 等 。 在 产生 符合 XML 结构 的 
文件 过 程 中 ,不 成 比例 的 输出 /输入 容易 造成 数据 更 新 
所 引起 的 计算 机 资源 占用 和 正常 工作 停顿 等 问题 , 因 
此 ,建议 采用 不 定期 转 储 更 新 的 步骤 。 

(3 ) 涉 及 到 获取 许可、 识别 符 和 数据 模型 的 裸 数 
据 发 布 ,需要 经 过 4 个 步骤 :加 载 HTTP. Server 描述 发 
布 的 数据 集 .附加 许可 .登记 数据 集 等 。 

(4) 必需 为 数据 选择 合适 的 RDF 词汇 (例如 书目 
数据 选择 bio 等 ) 以 转换 标识 符 和 数据 ,接着 映射 和 转 
换 裸 数据 到 RDF 再 写 人 HTTP URIs 以 描述 资源 ,最 后 
以 SPARQL 接口 和 Pubby 框架 的 HTML 方式 呈现 。 
4.2 ”将 开放 数据 ( 馆 外 ) 转 化 为 馆 内 资源 ( 馆 内 ) 

不 断 增长 的 社会 网 络 数 据 , 成 为 开放 数据 的 一 个 
重要 组 成 部 分 ,因此 ,新 的 分 布 式 体 系 结构 已 经 建立 在 
语义 网 标识 体系 (如 RDF(S)/ OWL, RDFa, SPARQL 
等 ) 之 上 ;新 的 范式 不 仅 要 让 用 户 拥有 自己 的 数据 ,也 
要 通过 语义 网 增加 他 们 的 数据 ,所 以 在 诸如 DBpedia 
的 集中 标注 和 检索 组 件 的 基础 上 ,可 以 开发 基于 图 形 
的 RDF 基础 结构 独立 于 上 下 文 语义 关系 图 和 外 部 信 
息 源 ,如 搜索 引擎 结果 和 社会 性 标签 系统 等 的 关联 数 
据 集 等 ,作为 蔡 代 网 页 排名 技术 的 可 扩展 技术 ,利用 
LOD 语义 标记 ,生成 查询 返回 近似 结果 的 手段 。 
具体 做 法 是 利用 DBpedia 建 模 信息 检索 框架 ,然后 ,从 
这 些 概 念 中 提取 搜索 历史 特征 向 量 ,在 用 户 查 询 的 数 
据 基础 上 ,建立 LOD 模型 。 不 过 ,这 种 模型 需要 有 
维护 批 次 导入 和 批 次 处 理 的 能 

终端 用 户 通常 根据 不 同 目 的 在 社会 标签 系统 中 标 
EAR H 注释 条 目 和 描绘 内 容 , 例 如 列 出 照片 中 出 现 的 
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对 象 ,或 表达 有 关 条 目的 上 下 文 信息 ,或 者 自我 引用 和 
组 织 个 人 内 容 (如 意见 .评论 ) 等 ;假设 检索 内 容 含有 相 
当 大 比例 的 标签 ,那么 ,识别 基本 标签 的 个 人 意愿 ,可 能 
有 利于 提高 搜索 和 推荐 过 程 的 准确 性 。 在 实践 上 , 建 
议 考 虑 更 多 范围 取样 和 可 持续 运行 的 成 本 问题 。 
4.3 ”其 他 可 能 的 发 展 

关联 数据 的 本 质 是 将 本 体 和 相关 数据 资源 按 昭 
RDF 格式 的 标准 链接 起 来 ,同时 要 求 支 持 HTTP URI 
访问 和 RDF 查询 语言 SPARZL 检索 。 按 照 这 个 原则 ， 
图 书馆 之 间 可 以 进行 关联 数据 的 应 用 ,例如 德国 开发 
的 R2R 从 词汇 和 数据 集 实例 提升 RDF 的 链接 能 力 ,将 
PRDF 和 RDF 进行 关联 ,以 达到 LOD 的 目的 。 然 而 ， 
3 着 数据 集 的 不 断 增长 ,由 于 数据 发 布 的 开放 性 ,数据 
ce 上 下 文 无 关 以 及 通用 的 资源 标识 等 所 引发 对 象 共 指 
题 中 会 困扰 图 书馆 应 用 关联 数据 技术 的 决定 。 另 
06S- 方面 ,关联 数据 技术 能 够 处 理 图 书馆 知识 资源 的 数 
(所 ,但 是 用 户 使 用 行为 的 数据 更 多 涉及 开放 性 的 标准 、 
CI .许可 原则 ,而 这 些 数据 是 图 书馆 应 用 LOD 实现 
> 天 放 数 据 的 关键 ,并 且 是 该 馆 独 一 无 二 的 数据 。 


C 未 来 应 用 LOD 的 几 个 方向 


(1) 支 撑 书 目 数据 品质 保障 
È 。 从 事 或 者 曾经 从 事 编 目 性 质 工作 的 馆 员 ,都 明白 
-建立 和 维护 叙 词 表 是 复杂 和 艰巨 的 任务 。 如 果 利 用 来 


“给 单 "“ 转 单 ”“ 键 单 ” 等 工作 。 

(3) 支 撑 信 息 计 量 分 析 

关联 开放 数据 提供 增强 数据 可 用 性 和 实用 性 的 机 
会 ,运用 得 当 ,能够 全 面 提升 各 个 领域 科技 发 展 。 在 大 
量 已 发 表 的 文献 中 ,大 多 数 是 不 可 机 读 的 格式 ,如 何 进 
行 信息 抽取 组 织 数据 并 且 提 升 准确 性 ,就 成 为 一 项 热 
点 议题 。 例 如 , 目前 正在 发 展 中 的 PatentEye 原型 系 
统 , 其 目的 就 是 针对 专利 文献 中 的 化 学 反应 ,进行 信息 
抽取 工作 ,捕获 反应 物 和 产品 标识 的 数据 ,加 快 科研 工 
作 的 信息 处 理 效率 ”。 类 似 PatentEye 的 系统 ,着 重 借 
助 关联 开放 数据 ,以 达到 文本 挖 据 和 信息 组 织 的 功能 。 

(4) LERA SE APR 

世界 知识 产权 组 织 中 的 国际 专利 分 类 ,对 专利 搜 
索 至 关 重 要 ,因为 它们 通常 作为 一 个 搜索 过 程 中 的 切 
入 点 。 如 果 利 用 来 自 维基 百科 的 科学 门户 网 站 对 于 一 
门 科 学 的 分 类 方法 , 则 能 够 因为 它们 不 同 的 分 类 方法 
而 分 配 不 同 的 类 别 ,可 以 利用 LOD 建立 专利 分 类 集成 
和 交互 框架 ,实现 允许 不 同 的 专利 本 体 在 广泛 互动 中 
的 数据 集 整合 ”。 目 前 ,这 是 专利 计量 和 专利 竞争 情 
报 中 的 一 项 前 沿 研 究 , 即 利 用 关联 开放 数据 ,挖掘 专业 
学 科 门 户 网 站 的 专业 学 科 分 类 ,然后 对 照 国际 专利 分 
类 ,收集 相关 专利 并 予以 分 析 。 

(5 ) 支 撑 数 字典 藏 的 建设 能 力 

传统 上 ,数字 典藏 的 含义 是 扫描 、 建 档 、 和 备份 和 有 


np 


EIER E, ESSA Le SCA ATIS ROI A 4 
OR IE eL dem AP cid de 0 TERE RAHE, 
因为 LOD 提供 了 一 组 庞大 的 结构 化 数据 ,因此 一 旦 转 
变 为 某 个 词 库 ,其 准确 率 相对 较 高 ,此 外 ,即便 是 专家 
或 者 专业 图 书馆 员 不 了 解 语义 网 及 其 技巧 ,也 能 够 根 
据 词 库 顺利 进行 氢 词 表 的 工作 。 

(2) 支 撑 电子 资源 管理 系统 

使 用 语义 网 技术 和 关联 数据 的 原则 ,可 以 克服 从 
电子 内 容 供应 商 被 动 接收 资源 清单 或 者 在 特定 模块 上 
操作 的 限制 ,提高 资源 列表 管理 工具 的 数据 互 操作 
性 1。 目 前 ,所 有 图 书馆 对 于 电子 资源 管理 的 操作 流 
程 , 必 需 是 等 待 集成 商 提供 资源 列表 ,将 之 转化 为 资源 
清单 上 传 后 进行 管理 ,这 个 时 间 取 决 于 内 容 提 供 商 “给 
单 ”的 速度 ,以 及 图 书馆 员 “ 键 单 " 的 工作 速度 ; 另 一 种 
方式 是 订购 知识 库 , 从 知识 库 中 “ 转 单 " 到 电子 资源 管 
理 的 资源 清单 中 。 应 用 LOD 或 许 能 够 加 快 “ 取 单 ”、 
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限度 地 取 用 。 然 而 ,要 扩大 数字 典藏 的 建设 能 力 ,除了 
经 费 和 人 力 投 入 外 ,还 可 以 依靠 技术 驱动 数字 典藏 的 
创新 工程 。 例 如 ,依照 创新 理论 的 动因 ,应 用 于 文化 遗 
产 领 域 的 开放 数据 ,可 基于 语义 网 技术 和 规范 ,创建 一 
个 综合 性 的 语义 知识 库 , 通 过 LOD 组 成 类 似 博 物 馆 开 
放 云 的 数据 集成 应 用 。 厌 由 LOD 减少 建 档 所 需要 
投入 的 元 数据 编辑 人 员 ,将 数据 的 质量 控制 问题 变 为 
较 容易 处 理 的 数据 品质 评估 方法 ,并 且 将 优质 数据 转 
为 开放 数据 ,提供 另 一 种 域外 服务 。 

(6) 支 撑 学 科 服 务 的 舱 入 模式 
工业 生态 学 (于) 是 一 个 新 兴 的 研究 领域 ,需要 社 
群 驱 动 数 据 的 采集 、 加 工 \ 保 管 和 共享 ,以 及 数据 和 知 
识 的 共享 机 制 ;由 于 涉及 的 技术 和 标准 类 型 ,在 许多 工 
业 生 态 学 家 的 正常 工作 范围 之 外 ,因此 大 批 年 轻 学 者 
在 网 络 上 对 此 展开 讨论 "i。 但 是 ,人 们 很 少 注意 到 : 
图 书馆 学 有 大 量 数据 管理 的 成 功 经 验 和 失败 教训 ,可 


以 少 走 弯路 ;研究 型 图 书馆 有 专业 的 学 科 馆 员 和 系统 
E 制 人 才 , 可 以 作为 支援 。 在 交叉 学 科 、 新 兴学 科 、 试 
验 学 科 中 ,存在 许多 意识 到 或 者 没有 意识 到 自己 需要 
关联 开放 数据 服务 的 社 群 ,这 些 人 群 是 图 书 情报 服务 
团队 的 潜在 服务 对 象 。 


6 ”走向 开放 科学 的 图 书馆 LOD 应 用 


LOD 还 存在 一 些 其 他 问题 ,例如 ,在 网 络 环境 中 ， 
人 们 常会 发 现 一 些 值得 怀疑 \ 其 至 自 相 矛盾 的 信息 , 判 
定 这 些 信息 DERE 助 数据 溯源 (Data Prove- 
nance) ;目前 创建 溯源 信息 通常 采用 标注 或 者 查询 求 
T 逆 两 种 方式 ,并且 存在 多 种 溯源 模型 ,然而 确保 科学 流 
的 溯源 信息 的 完全 可 重 算 能 力 是 一 项 挑战 ”。 在 
Š J& LOD 的 同时 ,也 必须 考虑 其 他 相关 议题 的 进展 ， 
4 能 完整 展现 图 书馆 的 信息 图 谱 变 迁 的 全 貌 ,使 图 书 
HERE 7] ,以 及 在 开放 科学 时 
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